今天來學習
基本上這是一個 OCR[註4] 的問題,各位在刷票、作爬蟲的時候應該也處理過相關議題。我是看 wiki 才知道原來有下面這回事…
根據CAPTCHA測試的定義,產生驗證碼圖片的演算法必須公開,即使該演算法可能有專利保護。這樣做是證明想破解就需要解決一個不同的人工智慧難題,而非僅靠發現原來的(秘密)演算法…
這個主題出現在實戰的第五章,結果只是用 mnist data set 做完手寫字辨識就算一個章節了 XDDDDD,這我們昨天就做過了,baseline 準確率也有個 99.09%...
我找到合適的開放資料集再來寫 lab 吧
值得一提的是驗證碼之父,也是 Duolingo 創辦人, Luis von Ahn,這位 CMU 教授的故事相當值得一看[註5]